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(1 安徽 大 学 管理 学 院 合肥 230039; 2 中 山大 学 信息 管理 学 院 ， 广 州 ，510006) 
摘要 : [目的 /意义 ] 数 字 叙 事 作为 一 种 在 线 叙事 ， 有 利于 增强 红色 人 物资 源 的 可 解释 性 与 人 机 
互动 性 ， 为 优化 红色 人 物资 源 知识 化 开发 提供 可 能 [方法 /过 程 ] 在 梳理 历史 人 物资 源 知识 化 
开发 与 红色 人 物 相关 研究 基础 上 , 提出 由 叙事 资源 整合 层 、 叙 事 元 素 抽取 层 和 叙事 作品 生成 
层 组 成 的 红色 人 物资 源 数 字 叙 事 基 本 框架 ， 紧 接着 以 “ 皖 西 红色 人 物 ” 为 例 ， 将 知识 图 谱 作 
为 叙事 工具 进行 实证 研究 。[ 结 果 / 结 论 ] 红 色 人 物资 源 数 字 叙 事 框 架 可 完善 目前 主要 依据 红色 
资源 “内 容 ” 和 “外 部 ”两 个 层次 设计 实体 语义 关联 的 局 限 ， 形 成 了 可 操作 性 的 结构 流程 ， 
为 红色 资源 知识 化 开发 提供 借鉴 ; 较 传统 人 工 抽取 与 规则 匹配 的 知识 抽取 方式 , 基于 本 体 与 
BERT 模型 的 三 元 组 批量 抽取 模式 提高 了 红色 人 物资 源 知识 抽取 效率 ; 借助 知识 图 谱 实 现 了 
红色 人 物资 源 可 视 化 和 主题 叙事 的 知识 发 现 , 佐证 了 数字 叙事 在 红色 人 物资 源 知 识 开发 和 组 


织 中 的 应 用 价值 。 
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1 引言 


习近平 总 书记 多 次 对 红色 文献 资源 开发 利用 提出 要 求 , 并 上 升 至 国家 整体 文化 战略 层面 ， 
强调 要 用 好 红色 资源 ， 广 续 红 色 血 脉 ， 努 力 创造 无 愧 于 历史 和 人 民 的 新 业绩 巾 。 近 年 来 ， 红 
色 文 献 资 源 整合 利用 和 开发 已 不 在 局 限于 元 数据 等 外 部 特征 的 浅 层次 描述 , 而 是 深入 到 资源 
内 部 利用 实体 与 关系 构成 “知识 元 ”进行 表征 , 进而 通过 挖掘 资源 中 “知识 元 ”的 语义 关联 
以 实现 增值 外。 红色 人 物 作 为 红色 文化 的 缔造 者 和 传播 者 ， 是 红色 资源 内 容 呈 现 和 展演 的 主 
ro HRAB, PES “UTS, SHRP A, AMT, ASIC” 2 ATM, HP eee 
技术 应 用 水 平 不 高 和 多 模 态 特征 识别 不 全 的 现实 难题 内 ,传统 平面 与 线性 叙事 已 无 法 满足 当 
前 用 户 的 多 元 需求 , 为 此 红色 人 物资 源 的 传统 叙事 豚 待 向 数字 叙事 转化 , 特别 是 历史 语 境 下 
红色 人 物资 源 叙 事 的 可 解释 性 和 资源 平台 的 人 机 交互 性 等 方面 仍 有 待 完 善 。 

叙事 理论 作为 研究 “在 时 间 和 因果 关系 上 意义 有 着 联系 的 一 系列 事件 的 符号 再 现 ” 相 关 
现象 的 理论 总 称 , 通过 其 空间 -道德 -互动 - 跨 媒 介 等 叙事 体系 为 知识 组 织 提供 理论 指导 , 可 生 
动 地 再 现 革 命 文化 史料 之 间 的 关系 ,完整 呈 现 历史 史实 ， 避 免 支离破碎 式 解 读 ， 使 红色 文献 
资源 价值 的 发 据 更 加 充分 I。 为 此 ， 本 研究 在 考虑 红色 人 物资 源 来 源 、 类 型 、 内 容 及 结构 
等 多 样 性 特征 基础 上 , 引入 氢 事 理论 探索 资源 整合 、 元 素 和 元 素 关系 抽取 以 及 知识 应 用 的 红 


一 、 
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色 人 物资 源 数字 叙事 框架 ， 并 以 “ 皖 西 红色 人 物 数据 ”为 例 ， 探 索 红 色 人 物资 源 知 识 关联 ， 
重 构 人 - 事 - 地 -时 等 实体 场景 ， 完 成 红色 人 物资 源 的 知识 聚合 ,形成 融合 叙事 与 资源 内 外 部 特 
征 的 多 层次 知识 组 织 与 服务 体系 。 


2 文献 回顾 
2.1 历史 人 物资 源 知识 化 开发 相关 研究 

数 智 技术 发 展 推动 了 历史 人 物资 源 知识 组 织 与 智慧 服务 的 进程 , 其 知识 化 开发 的 相关 理 
论 与 实践 不 断 发 展 , 其 研究 成 果 逐 渐 由 粗 粒 度 的 文献 整理 到 细 粒 度 的 知识 组 织 转变 , 历史 人 
物资 源 组织 与 数字 人 文 研 究 的 知识 化 开发 程度 较 大 提高 。 目 前 国内 外 研究 主要 聚焦 于 本 体 丰 
究 、 知 识 图 谱 构 建 、 知 识 库 建 设 三 个 维度 。 
第 一 ， 本 体 研 究 方面 ， 主 要 关注 如 何 构建 历史 人 物 本 体 模型 ， 如 先秦 人 物 知 识 本 体 模 型 


和 靖江 王府 人 物 关系 等 ， 并 应 用 构建 的 历史 人 物 本 体 模型 进行 知识 抽取 、 人 物 关系 推理 ， 进 
而 改善 用 户 查找 知识 的 体验 Bi0， 第 二 ， 知 识 图 谱 方面 ， 如 学 者 分 别 聚 焦 于 历史 人 物 多 层 关 
© 系 网 络 来 识别 历史 人 物 间 的 不 同 派系 趾 、 构 建 人 物 社会 网 络 图 谱 对 宋代 浙江 中 部 地 区 梧州 的 
© 亲属 与 学 社 变迁 (J、 历 史 名 人 游学 足迹 关系 数据 模型 UI、 人 物 履 历 知识 图 谱 的 自动 化 构建 
方法 69 及 数字 人 文 分 析 工 具 探索 名 人 日 记 资源 挖掘 09， 并 开始 注意 隐藏 关系 的 推理 9， 该 
Q 维度 研究 注重 实证 检验 ， 其 案 列 较为 多 元 ; 第 三 ， 知 识 库 建 设 方面 ， 学 者 多 探索 有 关 人 物 专 
N 题库 的 建设 思路 和 优化 途径 07， 如 利用 关联 数据 技术 对 图 书馆 特 藏 资源 进行 开发 与 重组 ， 
Ai 构建 了 家 谱 知 识 服 务 平台 ,该 平台 不 仅 支持 寻根 搜索 服务 ， 还 为 科研 用 户 提供 数据 分 析 支 持 
> 0819]， 以 及 学 术 名 人 知识 库 建设 的 基本 模式 ， 并 以 吴 宝 康 学 术 名 人 知识 库 为 例 探讨 实践 探索 
中 的 技术 与 操作 流程 21。 


2.2 红色 人 物资 源 相关 研究 

近年 来 , 红色 人 物资 源 整合 开发 与 研究 工作 受到 日 益 重 视 , 图 档 博 等 文化 记忆 机 构 根 据 
当地 或 本 馆 特 藏 陆续 开展 红色 人 物资 源 的 整理 并 提供 在 线 服务 , 代表 性 平台 如 陕西 省 图 书馆 
的 陕 甘 宁 边区 红色 记忆 。 人 物 库 CE0、 复 旦 大 学 图 书馆 的 陈 妆 专题 库 C、 上 图 红色 文献 平台 
的 中 共 组 织 史 专 题库 P] 等 。 不 难 发 现 ， 红 色 人 物资 源 正 在 发 生 “ 藏 ”到 “用 ”的 转变 。 与 
此 同时 ， 现 有 研究 多 关注 红色 人 物资 源 库 的 建设 及 其 资源 组 织 与 应 用 ， 有 具体 为 : 第 一 ,红色 
人 物资 源 库 的 建设 。 守 鹏 以 陕 甘 宁 边 区 红色 记忆 人 物 库 为 例 , 介绍 了 红色 人 物 数据 库 构 建 的 
流程 与 经 验 ， 为 红色 人 物 数 据 库 构 建 提供 参考 和 借鉴 P]; 孙 烈 涛 以 周恩来 图 书馆 数字 化 建 
设 为 例 ， 提 出 了 红色 教育 资源 数字 化 服务 建设 模式 多 。 第 二 ， 资 源 组 织 与 应 用 。 张 云 中 等 
提出 了 基于 知识 谱 图 红色 历史 人 物 知识 问答 服务 框架 , 并 以 老 上 大 历史 人 物资 源 为 语料库 进 
行 了 平台 搭建 ， 实 现 了 红色 历史 人 物资 源 的 细 粒 化 组 织 与 知识 服务 B; 刘 伟 丽 构建 中 共 一 大 
人 物 知 识 图 谱 ， 实 现 了 人 物 、 事 件 、 地 点 、 机 构 等 要 素 的 语义 关联 ， 为 红色 人 物资 源 的 语义 
化 组 织 提 供 参 考 P3。 


| 


综 上 所 述 ， 红 色 人 物资 源 的 在 资料 整理 、 数 字 化 以 及 专题 库 建 设 已 经 取得 了 初步 成 果 ， 
但 仍 存 在 较 大 探索 空间 : 首先 研究 视角 大 多 从 红色 文献 资源 开发 的 整体 考虑 , 红色 人 物 作为 
红色 文化 的 重要 元 素 或 主题 ， 对 其 深入 挖掘 有 待 扩展 ; 其 次 , 红色 人 物资 源 知 识 表达 体系 的 
构建 中 多 将 资源 置 于 数据 要 素 层 面 , 难以 构建 复杂 的 知识 体系 ,以 及 难以 解读 传达 革命 文化 
蕴含 的 深刻 内 涵 ， 对 于 红色 文献 主题 聚 类 、 语 义 关 联 与 知识 发 现 等 沉浸 式 挖 掘 有 待 加强 ; 此 
外 ,部 分 学 者 逐渐 发 现 数字 叙事 对 红色 文献 资源 研究 的 重要 性 ， 并 探索 了 红色 档案 资源 的 叙 
事 表 达 、 人 氢 事 性 开发 模型 及 多 模 态 红色 馆藏 开发 的 优化 策略 后 "26234, 然而 对 于 红色 人 物资 源 
叙事 逻辑 及 一 般 性 框架 的 探索 ， 特 别 是 实证 研究 尚 有 待 加 强 。 基 于 此 ， 本 文 引入 氢 事 理论 ， 
契合 资源 开发 需求 , 设计 红色 人 物资 源 数字 叙事 框架 , 并 以 皖 西 红色 人 物 为 例 进行 实 证 研究 ， 
为 多 模 态 红色 人 物资 源 知识 化 、 场 景 化 开发 提供 借鉴 。 


ee 3 红色 人 物资 源 数字 叙事 框架 设计 
本 文 在 参考 Barber JEFE、 付 雅明 、 张 斌 等 学 者 Cs30 对 叙事 理论 探讨 、 框 架 搭建 和 研究 方 
法 基础 上 , 结合 红色 人 物资 源 开发 需求 与 用 户 体验 , 归纳 出 红色 人 物资 源 数字 叙事 的 必 备 要 
素 、 实 施 过 程 与 应 用 场景 ; 与 此 同时 , 借助 叙事 理论 协同 完善 红色 人 物资 源 知识 本 体 核心 词 
表 ， 完 善 目前 主要 依据 资源 “内 容 ” 和 “外 部 ”两 个 层次 设计 实体 语义 关联 的 局 限 。 为 此 ， 
形成 面向 数字 叙事 的 红色 人 物资 源 知识 化 开发 理论 框架 , 该 框架 分 为 叙事 资源 整合 层 、 叙事 


元 素 抽 取 层 与 叙事 作品 生成 层 ， 为 后 续 实 证 研究 提供 理论 指导 ， 有 具体 见 图 1。 
A X 
: 叙事 元 素 叙事 模板 AFIA 互动 模式 
作 a 间 时 间 on 知识 图 谱 知 /问答 叙事 
口 地 点 “地 点 + 人 物 + 事 件 ” GIS 可 视 化 浏览 
创 人 物 D O waa D 游戏 >| 作品 
作 ae “ 时 间 + 地 点 + 人 物 + 事 件 ” seoses sevens 
层 历史 背景 ARW. 知识 发 现 
CS NK A 7 
叙事 建 模 元 素 抽取 元 素 融 合 元 素 储存 
元 人 人 实体 识别 
= 本 体 词 表 选择 实体 识 办 文本 相似 度 格式 转换 
AF | 7 对 象 属性 定义 |O) Aam O| 知识 链接 |O AESA => 
理论 数据 属性 定义 Eo ATHIK 图 数据 库 储存 
is 本 体 构建 方法 =e 的 元素 有 其 
去 A ie: 
i Pe a ee ee ee a en eae Se et eee et od 1 
1 
: | 资源 来 源 资源 类 型 资源 内 容 资源 结构 | | 
资 | !| 图 书馆 /档案 馆 文本 图 书 、 期 和 | 
源 | !| 博物 馆 /纪念 馆 | + 图 像 +| “书信 、 报纸 |+| Pae fi 
文献 数据 库 实物 文件 、 票 据 半 结 构 化 | 
整 | || “政府 网 站 视频 红歌 纪录片 结构 化 | | 
纪 | | 众 包 平 台 音频 传单 、UGC | 
alt | 


q1 红色 人 物资 源 数字 叙事 框架 


3.1 叙事 资源 整合 层 

叙事 资源 整合 层 主要 目标 是 完成 对 不 同 来 源 、 类 型 .内 容 及 结构 等 红色 人 物资 源 的 整合 ， 
使 其 数字 化 、 文 本 化 与 资源 化 ， 为 数字 叙事 提供 数据 基础 。 有 具体 步骤 如 下 : 红色 人 物 数据 因 
历史 原因 ， 其 资源 来 源 较为 分 散 ， 资 源 类 型 、 内 容 多 样 ， 据 此 按照 数据 结构 化 程度 ， 将 红色 
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人 物资 源 分 为 非 结构 化 数据 、 


的 预 处 理 与 资源 库 构 建 。 值 得 注意 的 是 : 


符 识别 或 人 工 标 注 等 方式 才能 实现 文献 的 数字 化 和 文本 化 ; 
官方 网 站 等 相关 红色 人 物 词 条 记录 ， 此 类 数据 具有 价值 高 、 分 布 广 和 多 模 态 的 特点 ; (3) 


红色 人 物 专题 库 已 


行 高 度数 字 化 整合 ， 


结构 化 数据 与 结构 化 数据 ; 并 在 此 基础 上 完成 红色 人 物 数据 


(1) 原始 红色 文献 属于 非 结 构 化 数据 ， 则 经 过 字 
(2) 进一步 的 整合 知识 百科 与 


其 数据 较为 规整 与 结构 化 ,数据 中 元 余 的 部 分 较 少 ， 


可 信 度 较 高 ， 可 直接 作为 数据 分 析 的 材料 。 
3.2 叙事 元 素 抽取 层 


叙事 元 素 抽取 


事 单元 的 处 理 与 生成 。 在 整合 
流程 划分 为 叙事 建 模 、 元 素 抽 
两 个 层次 设计 实体 语 

C1) 元 素 建 模 完 成 红色 人 物 数字 叙事 概念 层 的 设计 ， 即 红色 人 物资 源 本 体 构 建 ， 


层 的 主要 功能 是 借助 本 体 与 知识 
叙事 资源 的 基础 上 ,参考 知识 抽取 流程 S931， 将 叙事 元 素 抽取 


取 相 关 技 术 实现 红色 人 物资 源 最 小 叙 


区 、 元 素 融 合 与 元 素 储存 ， 为 此 完善 资源 “内 容 ” 和 “外 部 ” 


义 关 联 的 局 限 。 有 具体 如 下 : 


BART SNEAK, HA 
领域 知识 的 标准 化 与 规范 性 。 


是 
[ 色 人 物资 源 相 关 术 语 及 其 属性 进行 梳理 与 定义 ,实现 
(2) 以 红色 人 物 本 体 模 型 为 依据 对 红色 人 物资 源 进 行 叙 事 元 


素 抽 取 ， 可 分 为 实体 抽取 、 属 性 抽取 与 关系 抽取 。 其 中 实体 抽取 是 指 从 文本 中 抽取 现实 存在 


相关 属性 进行 补 全 ， 


取 通 常会 提取 不 同 实 
人 物 数据 的 多 源 异 构 性 


本 之 间 的 关联 关系 ， 


并 具有 相互 区 别 的 一 类 物体 ， 例 如 人 物 、 时 间 、 地 点 与 事件 等 ， 属 性 抽取 通常 对 某 一 实体 的 
以 事件 实体 为 例 ， 补 充 事件 的 发 生地 、 发 生 时 间或 相关 人 物 等 ; 关系 抽 


且 这 些 关系 具有 一 定 的 方向 性 。 (3) 考虑 到 红色 


E， 知 识 表征 的 形式 也 呈现 出 多 样 性 ， 因 此， 需要 对 抽取 的 元 素 与 关系 


实施 分 析 、 整 合 和 消 歧 等 知识 融合 。 例 如 : 共 指 问题 ， 多 个 不 同 描述 指 代 同一 叙事 元 素 ， 例 


如 同一 个 人 物 的 不 同 称呼 或 由 于 历史 变迁 所 产生 的 地 名 变更 ; 歧义 问题 ,叙事 元 素 名 称 可 以 


(4) 元 素 储存 ， 首 先 将 抽取 的 叙事 元 素 、 属 性 与 关系 


指 代 多 个 真实 实体 ， 


导致 表意 不 清 。 


转换 成 SPO 三 元 组 形式 ， 如 < 元 素 ， 关 系 ， 元 素 > 与 < 元 素 ， 属 性 ， 属 性 值 >， 构 成 描述 红色 
人 物资 源 最 小 知识 元 ;其 次 将 生成 的 数据 批量 导入 到 数据 库 进行 储存 。 
3.3 叙事 作品 创作 层 


叙事 作品 创作 层 


领域 专家 进行 互动 , eA SHA 


ENR MFR 


主要 功能 在 于 利用 以 图 结构 为 主 的 叙事 模板 , 借助 叙事 工具 与 普通 用 户 、 
[ 色 人 物资 源 叙 事 作 品 的 创作 并 加 以 呈现 ,其 核心 要 素 包括 叙 


叙事 工具 以 及 互动 模式 [303435]。 


本 单元 ， 包括 但 不 限于 时 间 、 空 间 、 人 物 、 事 件 、 物 体 等 ， 其 中 不 同 红 色 人 物资 源 的 元 素 之 
间 按 照 菜 种 规则 组 合 可 呈现 出 不 同 的 红色 人 物 相 关 故 事 。 
由 一 系列 特定 背景 、 人 物 、 事 们 


用 户 从 一 个 节点 到 另 


C1) 叙事 元 素 作为 构成 叙事 作品 的 基 


(2) 叙事 模板 也 称 叙 事 结 构 ， 是 


等 红色 人 物资 源 叙 事 要 素 组 成 的 较为 稳定 的 抽象 结构 ， 引 导 
个 节点 ， 实 现 不 同 红 色 人 物 故 事 素材 的 关联 与 组 合 。 
作为 用 户 与 资源 互动 的 媒介 ,， 可 有 效 演 染 并 呈现 叙事 作品 ， 可 根据 叙事 结构 与 情节 不 同 ， 选 
对 合适 的 叙事 工具 。 例如， 协助 人 文 研究 的 知识 图 谱 、GIS 与 时 间 轴 ， 


(3) 叙事 工具 


以 及 提供 娱乐 的 游戏 


软件 、AR/VR SG; (4) 互动 模式 是 用 户 使 用 叙事 工具 的 不 同方 式 ， 相 较 于 传统 叙事 ， 数 字 
叙事 具备 更 强 的 交互 性 ,主张 将 叙事 过 程 的 主导 权 让 渡 给 用 户 , 不 同 用 户 根据 自身 需求 进行 
知识 检索 、 问 答 、 可 视 化 浏览 、 游 戏 以 及 知识 发 现 等 。 


4 有戏 西 红色 人 物资 源 整 合 与 元 素 抽 取 
41 叙事 资源 获取 与 工具 选择 
4.1.1 数据 简介 与 获取 

本 文选 取 “ 皖 西 红 色 人 物 ” 资 源 作 为 案例 进行 实证 研究 ， 其 上 共有 可 行 性 、 可 操作 性 及 代 
表 性 : 其 一 ， 皖 西 地 区 是 江淮 分 水 岭 ， 具 有 “ 襟 江 带 淮 ， 承 东 接 西 ” 重要 的 地 理 位 置 ， 产 生 
了 丰富 的 红色 文化 和 革命 传统 ， 被 誉 为 红军 、 将 军 和 共和 国 的 “三 大 摇篮 ”， 皖 西 红 色 人 物 


数据 具有 重要 的 史料 研究 价值 B9， 其 二 ， 数 字 资 源 中 的 红色 人 物 所 属 时 间 跨 度 较 长 、 地 点 
J 分 布 较 广 ， 包 括 了 多 时 期 多 地 点 的 红色 英雄 ， 且 人 物 经 历 描述 非常 完整 ， 数 据 量 较为 丰富 ; 
= 其 三 ， 数 字 资 源 经 过 权威 部 门 编撰 与 审核 ， 具 有 权威 性 和 准确 性 。 与 此 同时 ， 由 于 数据 总 量 
SQ BOK, 笔者 使 用 python 的 scrapy 疏 取 并 解析 上 述 资源 中 红色 人 物 的 多 模 态 数据 ,涉及 文本 、 
= 图 片 、 音 视频 的 链接 地 址 等 ， 最 终 共 获取 676 条 红色 人 物 数据 ， 并 储存 为 JSON 文件 共 后 续 
N 使 用 。 
= 4.1.2 叙事 工具 选择 
N 本 文选 择 知识 图 谱 作 为 叙事 工具 。 知 识 图 谱 ， 一 方面 具备 成 熟 的 理论 与 技术 体系 ， 能够 
为 红色 人 物资 源 提供 的 数字 资源 知识 聚合 范式 参 鉴 ， 另 一 方面 ,作为 一 种 图 形 化 、 关联 化 的 


知识 表现 形式 , 不 仅 能 够 实现 红色 人 物资 源 的 网 状 叙事 , 而 且 其 强大 的 知识 检索 与 可 视 化 功 
能 可 以 为 人 机 交互 提供 条 件 ， 有 益 于 实现 红色 人 物资 源 的 历史 场景 再 现 与 知识 发 现 。 
4.2 叙事 建 模 

当前 研究 多 从 资源 “内 容 ” 和 “外 部 特征 ”两 个 层次 设计 实体 语义 关联 ， 可 以 较 好 的 描 
述 资 源 的 基本 内 容 但 整体 叙事 性 较 弱 。 数 字 叙 事 的 引入 使 得 红色 人 物资 源 从 单 向 、 线 性 叙事 
向 网 状 叙事 转变 ， 促 进 资源 的 叙事 性 、 细 粒度 与 关联 性 开发 ， 为 叙事 建 模 的 整体 设计 与 标准 
化 组 织 提供 理论 指导 。 本 文 将 实用 性 较 强 的 七 步 法 进行 红色 人 物资 源 本 体 构 建 ， 具 体 步 又 如 
下 : 

CL) 确定 本 体 适用 范围 和 查找 可 复 用 本 体 。 第 一 ， 本 体 主要 用 于 红色 人 物资 源 的 知识 
组 织 ， 以 红色 人 物 作 为 数据 源 ， 描 述 红色 人 物 基 本 信息 及 其 生平 履历 。 第 二 ， 复 用 本 体 是 指 
重复 使 用 现 已 公开 成 熟 本 体 中 类 或 属性 的 过 程 ， 有 助 于 减少 概念 重复 定义 ， 降 低 本 体 构 建 的 
复杂 度 与 成 本 ， 增 强 本 体 可 扩展 性 。 本 文通 过 对 关联 开放 词 表 (Linked Open 
Vocabularies ,LOV) 进行 检索 得 到 33 个 与 人 物 相关 的 本 体 词 表 ， 并 根据 各 人 物 本 体 的 特征 
筛选 出 相关 本 体 5 个 ， 包 括 rel (描述 人 与 人 之 间 关 系 的 本 体 ) 、bio 〈 描 述 人 物 传记 信息 的 
本 体 ) 、foaf (描述 互联 网 社交 信息 的 本 体 ) 、whois〈 描 述 个 人 资料 或 履历 的 本 体 ) 、shoah 


ANS 


《描述 大 屠杀 相关 的 概念 的 本 体 ) 。 


“TemporalEntity” ~ “Place”, “Event 


“otherName” “event” $. 


其 中 可 复 月 


”等 ， 可 复 月 


日 的 类 有 : “Person”、“Organization”、 


的 属性 有 : “birth”, “death”, “gender”, 


(2) 概括 红色 人 物资 源 本 体 核心 概念 和 分 类 体系 。 数 字 叙 事 的 核心 目的 在 于 通过 不 同 


的 叙事 逻辑 ， 借 助 数字 技 


术 最 大 程度 、 


征 与 更 细 知 识 粒度 的 概念 及 分 类 体系 ， 


核心 概念 : O 红色 人 物 ， 


抽取 出 人 物 、 组 织 机 构 、 时 间 、 事 件 、 地 点 、 资 源 等 元 素 。 第 二 ， 采 用 


建 ， 对 已 完成 的 顶层 概念 


最 细 粒 度 


具体 如 下 。 


的 还 原 历史 全 景 ， 因 而 


第 一 ,根据 红色 人 物资 源 
红色 人 物资 源 的 叙事 主体 ; @ 红色 人 物 的 人 生 履 历 。 人 物 的 履历 
一 般 包 含 求学 经 历 与 战争 经 历 ， 与 之 相关 的 概念 有 战争 事件 、 重 大 会 议 、 乡 


需要 总 结 并 提炼 多 特 
的 文本 特征 ， 其 


[ 色 地 点 ， 


其 中 HJ 


T FA ARETE 
了 进行 类 别 划 分 ， 确定 概念 之 间 的 父子 关系 ， 以 形成 红色 文献 本 体 


的 概念 分 类 体系 。 顶层 概念 实体 包括 “人 物 ”、“ 组 织 机 构 ”、“ 事 件 ”、“ 地 点 "、“ 资 源 ”"、“ 时 间 ”， 


其 中 “组 织 机 构 ”按照 其 成 立 的 性 质 被 分 为 学 校 、 


为 战争 事件 、 重 大 会 议 、 


行 分 类 ; “资源 "按照 其 载 


爱 


军事 机 构 、 党 组 织 和 政府 机 构 ;“ 事 从 


"被 分 


国运 动 以 及 重要 组 织 机 构成 立 ;“ 地 点 ”实体 按照 国家 行政 区 划 进 


体 类 型 分 为 实物 资源 与 数字 资源 。 分 类 体系 见 表 1。 
表 1 红色 文献 本 体 概念 分 类 体系 


级 类 标签 二 级 类 目 标签 
Person 人 物 z 
Organization 组 织 机 构 School 学 校 
Party 党 组 织 
Army 军事 机 构 
Government 政府 机 构 
CulturalOrganization 文化 机 构 
Event 事件 War 战争 事件 
Conference 重大 会 议 
Campaign 爱国 运动 
Establishment 重要 机 构 的 成 立 
Place 地 点 
Resource 资源 PhysicalResource 实物 资源 
DigitalResource 数字 资源 
OfficialPosition 官职 + E 
TemporalEntity 时 间 Instant 时 间 点 
Inerval 时 间 段 
(3) 定义 红色 人 物资 源 的 语义 描述 ， 即 属性 关系 定义 。 属 性 关系 定义 需 参 考 红 色 人 物 


资源 的 虚拟 场景 , 剖析 人 物 生 活 的 特定 环境 与 影 


响 事件 发 展 的 关键 节点 及 其 关联 。 本 体 属 ' 


m 
EE 


描述 资源 的 外 部 特征 ; 


可 表达 较为 完善 的 人 物 基本 信 


@@ 时 间 与 地 点 ， 


关系 由 数据 属性 与 对 象 属性 组 成 。 第 一 ， 数 据 属 性 。 数 据 属 性 如 表 2 所 示 ， 包 括 : 中 人 物 描 
述 ， 有 姓氏 、 名 字 、 字 、 人 性别、 生年 、 芋 年 、 受 教育 程度 等 ， 

奶 与 背景 ， 为 红色 人 物 氢 事 做 铺垫 ， 避 资源 元 数据 ， 

其 中 时 间 属 性 将 “年 月 日 ”进行 拆 分 与 组 合 ， 地 点 属性 则 按照 


省 -市 -县 /区 ) 进行 划分 ， 
了 类 与 类 之 间 的 关系 ， 如 表 3 所 示 ， 
习 于 、 参 加 、 加 入 ， 
中 ，@O) 与 资源 相关 ， 有 参考 于 、 馆 藏 于 、 馆 藏 
位 于 (地 点 ) 。 这 些 语义 关系 有 币 


可 适应 叙事 


利于 


述 红色 人 物 的 人 4 


玉 | 


家 地 理 的 行政 区 划 (国家 - 


较为 复杂 时 空 表达 。 第 二 ， 对 象 定 
包括 个 与 人 物 相 关 ， 有 出 生 / 死 亡 日 期 是 、 籍 贯 是 、 学 
E 履历， 塑造 完整 的 人 物 形象 ， 并 融合 到 叙事 
也 是 ; @ 与 事件 相关 ， 包 括 发 生 于 (时 间 ) 与 
上 于 促进 各 关键 节点 在 叙事 系统 中 的 相互 联结 ， 实 现 * 人 - 


BIE. MAURER A 


事 -时 -地 -资源 ”等 实体 之 间 的 微观 叙事 。 
表 2 数据 属性 
数据 属性 HIR 域 y E 
lastName 姓氏 Person xsd:string 
firstName 名 字 Person xsd:string 
courtesyName Y Person xsd:string 
Gender 性 别 Person xsd:string 
Education 教育 Person xsd:string 
imageUrl 到 像 链接 Person xsd:angURL 
Identifier 标识 符 Resource xsd:string 
Title 标题 Resource xsd:string 
Content 内 容 Resource xsd:angURL 
Description 资源 描述 Resource xsd:string 
Format 资源 格式 Resource xsd:string 
Carrier 资源 载体 Resource xsd:string 
Date HH (YYYY-MM-DD) Instant xsd:datetime 
yearMonth 年 -月 (YYYY-MM) Instant xsd:gYearMonth 
monthDay 月 -日 (MM-DD) Instant xsd:gMonthDay 
Year 年 (YYYY) Instant xsd:gYear 
Month H (MM) Instant xsd:gMonth 
Day H (DD) Instant xsd:gDay 
Country 国家 Place xsd:string 
Province 省 Place xsd:string 
City 市 Place xsd:string 
district/county 区 /县 Place xsd:string 


#3 对 象 属性 


对 象 属性 HR 域 范围 
Birthday 出 生日 期 是 Person TemporalEntity 
Deathday 死亡 日 期 是 Person TemporalEntity 
nativePlace 籍贯 是 Person Place 
Join 加 入 Person Organization 
takePartIn 参与 Person Event 
referFrom 参考 于 Person Resource 
Comrade 司 志 是 Person Person 
Relative 亲属 是 Person Person 
Undertake 担任 Person OfficialPosition 
heldBy 馆藏 于 Resouce Organization 
heldIn 馆藏 地 是 Resouce Place 
Occur 发 生 于 Event TemporalEntity 
locatedIn 位 于 Event Place 
(4) 构建 红色 人 物资 源 本 体 。 基 于 上 述 核 心 词 表 及 其 属性 关系 ， 利 用 本 体 构建 工具 pr 
otégé 进 行 本 体 构建 ， 并 以 RDF/XML 的 格式 进行 储存 ， 本 体 的 结构 如 图 2 所 示 。 
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7 ere 
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Y 一 relative (Domain>Range) 
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图 2 红色 人 物资 源 本 体 
4.3 元 素 抽 取 
4.3.1 算法 模型 结构 
第 一 ， 考 虑 到 红色 人 物资 源 中 存在 大 量 以 红色 人 物 为 Subject 的 三 元 组 结构 ， 本 研究 突 
破 已 有 “在 命名 实体 识别 的 基础 上 进行 关系 分 类 ”的 常见 关系 抽取 方式 ,参考 语言 模型 概率 
图 框架 ， 从 而 更 好 地 人 处理 “同一 (Subject，Object) 对 应 多 个 Predicate” 的 问题 ， 优 化 红色 
人 物资 源 的 三 元 组 抽取 。 其 概率 模型 如 公式 1 (yl~yn 表示 预测 的 输出 序列 ) : 


202307.00206v1 


chinaXiv 


P(Y oY sY n X )= 
P (y ax )P (Y azx ,yy DP (Y a KR OY GY vY n a) 
(1) 
具体 思路 : 首先 通过 Encoder 的 输出 x 加 上 序列 的 起 始 标 记 来 预测 第 一 个 单词 ， 然 后 假 
设 第 一 个 单词 已 知 来 预测 第 二 个 单词 , 依 此 递 推 , 直到 出 现 结束 标记 , 其 模型 如 公式 2 所 示 : 
P(s, p, 0) = 了 (S)P(olS)P(pls,o) (2) 
第 二 ， 为 了 进一步 处 理 “ 多 对 多 ”多 个 Subjects Object, Predicate) 问题 ， 本 研究 需 


要 采用 “ 半 指 针 - 半 标注 ” 
三 元 组 抽取 ， 主 要 逻辑 在 BERT 预 训练 模型 


结构 i 


行 再 处 理 。 


为 此 ， 采 取 BERT- 半 指针 


标注 的 方式 直接 进行 
4 上 直接 进行 fme-tune， 即 先 采 用 预 训 练 模型 对 


所 输 文本 进行 embedding， 然 后 使 用 " 半 指 针 - 半 标注 ”的 方式 预测 对 应 的 Subject 的 首 、 尾 位 


置 ， 之 后 ; 
续 预 测 Predicate 和 Object. 
对 于 每 一 利 


置 ， 模 型 直接 输出 结果 为 三 


测 。 模 


型 结构 如 图 3。 


值得 注意 是 ， 在 实际 预测 过 


H Predicate， 分 别 构建 “ 半 指 针 - 半 标注 ”的 结构 来 预测 对 应 的 Object 的 
元 组 形式 即 (S,P,O)。 


各 所 预测 的 Subject 对 应 的 embedding 与 BERT 输出 的 hidden-states 进行 拼接 ， 继 
十 程 中 可 能 存在 多 种 Predicate, AE 


i 


x 


BERT 


4.3.2 文本 标注 与 模型 训练 


首先 , 确定 抽取 的 实体 与 关系 。 
定 需 要 人 工 标注 的 实体 、 属 性 


籍贯 、 


构 ) 、 


参加 (事件 ) 


逝世 于 (年份) 、 又 名 、 


、 担 任 


上 (职务 ) 、 


与 关系 ， 其 中 人 物 、 


图 3 模型 结构 


出 生年 


性 别 是 、 


| 
BH DL AEN 


根据 当前 数据 源 的 特征 与 红色 人 物 本 体 的 类 与 属性 来 确 
份 、 死 亡 年 份 、 


其 他 名 称 
机 构 、 事 件 、 职 位 等 实体 分 别 用 标签 {Per,Bir,Dea,Oth,Gen,Loc,Org,Eve,Ran} 进行 表示 ， 
而 出 生 于 (年 份 )、 


尾 位 


其 中 , P 是 给 定 的 ， 根 据 标注 的 内 容 进 行 预 


EEEE 


、 人 性别 、 


SIF MM) . MA AL 


司 志 是 〈 人 物 ) 等 属性 或 关系 分 别 用 标签 {birthyear, 
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deathyear,othername,gender,nativeSpace,study,join,takePartIn,undertake,comrade} 进 行 表 示 。 其 
次 ,进行 数据 标注 。 训 练 数据 采用 开源 的 皖 西 红色 人 物 履历 资源 ， 并 使 用 Doccano 开源 预料 
标注 工具 对 分 割 好 的 人 物 数据 进行 标记 ， 标 记 完 成 后 ， 共 获取 到 红色 人 物 数据 1000 AK, 

将 标记 的 样本 以 8: 1: 1 的 比例 划分 训练 集 、 测 试 集 与 验证 集 。 最 后 ， 将 训练 


入 到 模型 中 进行 训练 。 模 型 的 超 参数 如 表 4 所 示 。 
表 4 模型 超 参数 
超 参 数 描述 参数 值 
maxlength 输入 句子 的 最 大 长 度 512 
batchsize 每 轮 实验 的 样本 批量 32 
epoch BRIER 20 
Learning rate 学 习 率 le-4 


4.3.3 模型 评价 


集 与 测试 集 导 


本 实验 采用 准确 率 (Precision )、 召 回 率 (Recall) 与 Fl 值 对 BERT 模型 及 其 变 体 ALBERT 
与 RoBERTa 进行 评价 , 结果 见 图 4, Precision, Recall 及 F1 (47) HA 0.832. 0.801 及 0.814。 
三 个 模型 中 BERT 模型 相对 性 能 较 差 , 而 ALBERT 45 RoBERTa 性 能 较为 接近 , 其 中 RoBERTa 
模型 效果 最 好 ， 这 说 明 该 模型 能 够 较为 准确 地 实现 红色 人 物资 源 三 元 组 抽取 。 


—@— Precision ~= Recall Fl 


0.84 
0.82 


0.8 
0.78 
0.76 i 


0.74 
0.72 


BERT ALBERT ROBERTA 


4 红色 人 物 文本 实体 关系 抽取 模型 评价 


4.4 TRMA 


因此 ， 本 文选 


FE RoBERTa+“ 半 指针 - 半 标 注 ” 对 皖 西 红色 文献 资源 进行 批量 三 元 组 预测 并 储存 。 


实体 融合 方法 主要 包括 文本 相似 度 计算 是 、 基 于 标准 化 词典 或 第 三 方 数据 库 的 知识 链接 


B1 以 及 人 工 筛选 与 蔡 换 B8， 本 文 借鉴 上 述 研究 的 处 至 
具体 方案 如 下 : 首先 进行 数据 预 处 理 , 剔除 实体 名 称 中 空格 以 及 特殊 符号 并 使 用 正式 命名 代 
替 缩 写 与 昵称 。 其 次 ， 根 据 实 体 类 型 采用 合适 的 知识 融合 方法 。 中 地 点 实体 副 
中 存在 同一 地 点 表述 存在 差异 或 地 区 行政 级 别 的 表达 的 层级 不 同 ， 如 “人 金 寨 ”、 


“安徽 省 金 寨 县 ”。 为 了 解决 这 一 问题 , 本 文选 用 中 


方式 ， 采 用 混合 方法 进行 实体 融合 ， 


ba, 地 点 实体 


“PRA” & 


国 省 市 县 区 域 公开 数据 集 作 为 规范 词 表 ， 


再 将 抽取 的 地 点 实体 与 规范 词 表 进 行 知 识 链接 。@ 人 物 实体 及 机 构 实体 融合 ， 上 海 图 书馆 开 


发 的 中 共 组 织 史 数据 库 是 目前 较为 完整 且 规 范 的 组 织 史 资料 , 本 文 将 其 作为 人 物 与 机 构 实体 
的 知识 库 进 行 知 识 链接 。@ 剩 余 实 体 本 文采 用 hanLP 工具 包 提 供 的 短文 本 语义 相似 度 模型 
来 计算 两 个 字符 串 的 相似 度 ， 该 模型 经 过 大 规模 语料库 训练 ， 具 有 较 高 的 准确 率 。 

以 “六 替 起 义 ” 与 “六 和 霍 农 民 起 义 ”为 例 ， 由 图 5 可 知 模型 给 出 的 相似 度 约 为 0.967， 
研究 认为 两 个 字符 串 相似 度 大 于 0.85 时 馈 ， 可 认为 其 属于 同一 实体 。 最 后 ， 对 实体 融合 结 
果 进 行人 工 评估 并 校正 。 


A hanLPtext.py 


Kat 


import hanlp 
sts = hanlp.load(hanlp.pretrained.sts.STS_ELECTRA_BASE_ZH) 
res = sts([ 


CARR, KERREN) 


lè 
print(res) 

Run: hanLPtext 

bE D:\pycharm\python\python.exe D:/pycharm/project/hanLPtext. py 
[0.9674696922302246] 

= 3 

F = Process finished with exit code 0 

= 


到 5 字符 串 相似 度 程 序 及 示例 


4.5 知识 图 谱 生 成 
da) 经 过 上 述 相关 步骤 ， 本 研究 共 获 得 实体 3247 个 、 属 性 2905 条 、 关 系 4035 K, A 
体 描述 见 表 5、6 所 示 。 


表 5 实体 、 属 性 描述 及 其 数量 


实体 名 属性 名 属性 描述 量 
姓名 人 物 姓名 676 
别名 人 物 的 字 、 别 名 、 化 名 等 162 
出 生 时 间 人 物 出 生年 份 514 

人 物 
逝世 时 间 人 物 逝 世 年 份 515 
性 别 人 物性 别 676 
籍贯 人 物 的 祖居 地 或 原籍 362 
事件 3 -- 399 
学 校 - - 150 
职位 - - 1717 
组 织 机 构 - - 305 

表 6 语义 关系 描述 及 其 数量 

关系 名 语义 描述 头 实体 尾 实体 数量 


加 入 某 人 兽 加 入 某 个 组 织 机 构 AD 组 织 823 
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参与 某 人 曾 参与 某 个 事件 人 物 时 间 815 
学 习 于 某 人 曾 学 习 与 某 个 学 校 人 物 学 校 221 
担任 某 人 曾 担任 过 某 个 职位 人 物 职位 1927 
同志 是 某 人 是 男 一 人 的 同志 人 物 AW 249 


(2) 三 元 组 数据 存储 。 本 研究 选择 目前 主流 的 图 数据 库 Neo4j， 并 借助 py2neo 第 三 方 

库 ， 将 经 过 知识 融合 的 三 元 组 数据 以 “实体 ， 属 性 ， 属 性 值 ” 与 “实体 ， 关 系 ， 实 体 ” 两 种 

形式 批量 导入 到 Neo4j F, 最 终生 成 包含 676 个 皖 西 红色 人 物 信息 的 知识 图 谱 ， 部 分 知识 图 
普 见 图 6。 


Overview > 


2-9 wW wv j 
S a) fe Node labels 
y CEID 
"o e. Da CED ED 
y in @ Ao 


Ss © 全 | Cy RED CD Types 


© © @ e Ce) @ Displaying 3,247 nodes, 0 
® -D relationships. 


' © 
JOGON ts 
TTA 


cp EAS 


5 皖 西 红色 人 物 知 识 图 谐 数 字 叙 事 应 用 初探 
5.1 知识 图 谱 检索 与 可 视 化 

检索 与 可 视 化 功能 作为 知识 图 谱 基 本 应 用 ，Neo4j 图 数据 库 集 成 了 用 于 检索 与 可 视 化 的 
图 形 交 互 界面 ， 用 户 可 以 通过 拖 动 、 放 缩 与 点 击 等 操作 直接 获取 图 谱 中 的 知识 ， 并 可 基于 
Cypher 语言 构建 检索 式 获取 所 需 图 谱 。 以 洪 学 智 将 军 的 为 例 ， 查 询 图 数据 库 中 的 相关 节点 
与 关系 构成 履历 图 谱 ， 其 查询 检索 式 为 “match p=(n:Person {name:' 洪 学 智 ')-[]->0 return p” 
结果 见 图 7。 
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id: 


name 


解放 海南 岛 
立夏 节 起 义 


Node Properties & 


eD 


万 山 群岛 战役 <id> 
中 国共 产 党 
ar 
dea 二 
ation 


birthye: 1913 


图 7 洪 学 智 将 军 的 履历 知识 图 谱 
图 7 左 侧 是 以 “ 洪 学 智 ” 人 物 节点 为 中 心 的 知识 图 谱 , 右 侧 为 图 谱 节 点 


类 型 与 数量 和 “ 潜 


学 智 ” 人 物 节点 的 属性 信息 。 由 图 谱 可 清晰 获知 ， 洪 学 智 将 军 G) 基本 信息 : 出 生 于 1913 
年 的 安徽 金 寨 ， 逝 世 于 2006 年 。 (2) 任职 经 历 : 加 入 中 国共 产 党 ， 并 担任 红军 连 长 、 团 政 
治 处 主任 、 红 四 军政 治 部 主任 、 抗 大 五 分 校 副 校长 、 解 放 军 总 后 勤 部 副 部 长 等 职 。 (3) 军 
事 经 历 : 参与 立夏 节 起 义 、 红 军 长 征 、 平 津 战役 、 辽 沈 战役 、 渡 江 战 役 、 抗 美 援 朝 等 军事 战 
役 。 通 过 对 知识 图 谱 的 网 络 化 表示 ， 可 清晰 地 呈现 出 红色 人 物 的 基本 叙事 属性 与 履历 信息 ， 


任职 、 军 事 经 历数 据 提供 参考 。 
5.2 知识 图 谱 检 索 与 主题 关联 知识 发 现 


并 且 对 红色 人 物 信 息 的 搜索 者 来 说 , 可 以 快速 了 解 红色 人 物 的 知识 关联 , 为 其 寻找 红色 人 物 


利用 图 数据 库 的 检索 与 可 视 化 功能 , 不 仅 能 快速 检索 到 红色 人 物 的 显 性 知识 , 还 可 以 基 
于 多 主题 关联 检索 发 掘 知识 图 谱 中 的 隐 性 知识 。 本 文 择 取 红 色 人 物资 源 叙 事 元 素 作 为 “ 原 材 
料 ”， 实 现 历 史 语 境 下 皖 西 红色 人 物资 源 的 主题 检索 与 多 元 数字 叙事 ， 例 妇 


为 中 心 的 知识 发 现 ， 探究 红色 人 物 生平 及 其 社会 网 络 关 系 ; QUE 


Jan, OU AAT 


HFIP OARE, OO 


RAEE HA RSS AP TC Se ie A A BL; @ 以 机 构 组 织 为 中 
心 的 知识 发 现 , 如 探究 中 国 工农 红军 第 四 军 上 共有 任职 经 历 的 红色 人 物 , 探讨 其 上 下 级 与 继任 
等 关系 ; 由 以 学 校 为 中 心 的 知识 发 现 ， 如 查询 知识 图 谱 中 所 有 “学 习 于 ” 
研究 红色 人 物 的 受 教育 经 历 ， 也 可 以 反映 出 各 学 校 人 才 教 育 情况 。 

本 研究 是 以 人 物 节点 为 中 心 进行 数据 演示 ， 选 取 革 命 烈士 徐 百 川 同志 的 履历 数据 为 例 ， 
构建 查询 所 用 的 Cypher 检索 式 为 “match p=(n:Person{name:'4 A )!|")-[]-Q return p” 并 展 


开 与 其 相连 节点 的 局 部 图 谱 ， 其中， 紫色 节点 代表 人 物 ， 桃 纪 


[ 色 节 点 代表 事 


的 关系 ， 不 仅 可 


HE, RETTAR 


表 学 校 ， 红 色 节 点 代表 机 构 ， 蓝 色 代 表 职 位 ， 结 果 见 图 8， 图 9 为 徐 百 川 节点 的 人 物 属 性 。 
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8 徐 百 川 同志 的 履历 图 谱 


Node Properties @ > 
CD 

<id> 475 

birthyear 1901 @ 

deathyear 1931 fa 

location 安徽 合肥 @ 

name 徐 百 川 


=) 


othername 张 泉 


图 9 节点 “ 徐 百 川 ” 的 人 物 属 性 

如 图 8、9 可 知 : 第 一 ， 徐 百川 同志 出 生 于 1901, WEF 1931 年 ， 安 徽 合 肥 人 ， 是 我 
党 早期 红色 英烈 ; 第 二 ， 曾 学 习 于 黄埔 军校 与 第 六 届 广 州 农民 运动 讲习 所 ， 与 姜 镜 堂 、 毛 正 
初 、 徐 育 三 、 余 武 溪 等 人 为 校友 关系 ; 第 三 ， 参 与 南昌 起 义 、 广 州 起 义 与 六 霍 起 义 等 革命 战 
役 ， 与 朱 列 山 、 吴 展 、 周 维 炯 等 人 为 战友 关系 。 值 得 注意 的 是 ， 徐 百川 与 姜 镜 常 、 孙 德清 等 
多 人 具有 相似 的 经 历 ， 例 如 姜 镜 堂 与 徐 百 川 属于 同一 时 代 , 不 仅 都 在 黄埔 军校 深造 ， 还 同时 
参与 了 六 霍 起 义 , 充分 展示 了 历史 语 境 下 主题 的 内 容 关 联 , 经 查 徐 百 川 与 姜 镜 堂 分 别 担任 红 
三 十 三 师 的 师长 与 政治 部 主任 ， 具 有 共事 关系 。 
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6 研究 结论 与 启示 


本 研究 在 考虑 红色 人 物资 源 来 源 、 类 型 
论 构建 了 红色 人 物资 源 数字 和 叙事 框架 ,并 借助 “ 皖 西 


用 图 数据 库 实现 了 图 谱 可 视 化 、 
理论 价值 层面: 第 


容 ” 和 “外 部 ”两 个 层次 设计 实体 语义 关联 的 


、 内 容 及 结构 等 多 样 性 特征 基础 上 ,基于 狂 事 理 
红色 人 物 ” 数 据 进行 实证 研究 ， 进 而 利 


知识 检索 与 知识 发 现 ， 具 有 理论 与 实践 双重 价值 。 


， 联 结 数字 叙事 与 数字 资源 开发 相关 理论 完善 了 依据 红色 资源 “内 
局 限 ,形成 了 可 操作 性 的 红色 人 物资 源 数字 氢 


事 框架 ， 有 助 于 完成 数据 化 -情境 化 -故事 人 化、 数据- 学术- 创造 的 递 进 过 程 与 逻辑 巡 变 ;第 二 ， 
对 皖 西 红色 人 物资 源 进行 了 主题 关联 和 语义 组 织 等 , 可 形成 红色 人 物 在 历史 时 期 的 社会 网 络 


关系 、 社 群 动态 变化 、 机 构 特 征 及 军事 教育 等 多 种 特 生 


历史 语 境 下 数据 的 解读 ， 并 辅助 


E 的 静态 -动态 知识 图 谱 ， 有 助 于 促进 


人 文学 者 研究 。 实践 价值 层面 : 第 一 ， 较 传统 人 工 抽取 与 规 


则 匹配 的 知识 抽取 方式 , 基于 本 


知识 抽取 效率 ， 降 低 数据 处 理 成 本 ,促进 纪 


本 与 BERT 模型 的 三 元 组 批 


抽取 模式 提高 了 红色 人 物资 源 


[ 色 文 献 传播 与 使 用 ;第 二 ， 将 静态 、 平 面 、 分 散 


的 红色 人 物 数据 转变 成 动态 、 立 体 、 聚 合 的 知识 网 ， 提 高 了 内 容 资源 之 间 的 关联 程度 ， 降 低 


了 红色 人 物资 源 检索 与 利用 的 
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Digital Storytelling Framework for Red Character Resources and Its 


Empirical Research * 
Xu Xiaojuan! Sun Aihual Chen Tao? 
1 School of Management, Anhui University, Anhui 230039 
2 School of Management, Zhongshan University, Guangzhou,5 10006 
Abstract: [Purpose/significance] Digital Storytelling as a kind of online narrative is condu 
cive to enhancing the interpretability and human-computer interactivity of red people's reso 
urces, which provides the possibility of optimizing the intellectual development of red peo 
ple's resources. [Method/process] On the basis of combing the knowledge-based developm 


ent of historical character resources and the research related to red characters, the basic fr 
amework of digital storytelling of red character resources composed of narrative resource 1 
ntegration layer, narrative element extraction layer and narrative work generation layer is p 
roposed, and then the knowledge mapping as a narrative tool is used as an example for e 
mpirical research on the "Red Characters of Western Anhui Province". [Results/conclusion] 
The digital storytelling framework of red people's resources can improve the current limit 
ations of designing semantic association of entities mainly based on the "content" and "ext 
ernal" levels of red people's resources, and form an operable structural process, which pro 
vides reference for the development of red people's resources' knowledge; compared with t 
he traditional manual extraction and rule-matching knowledge extraction, the ternary batch 
extraction mode based on ontology and BERT model improves the efficiency of red peopl 
e's resources' knowledge extraction; and with the help of the knowledge mapping to achie 
ve the red people's resources’ visualization and knowledge discovery of thematic narratives, 
it proves the value of the application of digital storytelling in the red people's resources' 
knowledge development and organization. 

Key words: red character resources; digital storytelling framework; knowledge mapping the 
matic; knowledge discovery 


